3. 5. 2022

Přehled témat

  • Proč grafy raději než text
  • Obecné principy vizualizace
  • Architektura vizualizace (grammar of graphics)

Proč grafy raději než text?

Florence Nightingale a Krymská válka (1850s)

Zdroj obrázku Highcharts.com

John Snow a epidemie cholery v Londýně

Zdroj obrázku Highcharts.com

Spočítejte všechny trojky

Zdroj Ware (2012)

Spočítejte všechny trojky

Zdroj Ware (2012)

Lépe si pamatujeme vizuálně

Zdroj Medina (2014)

Obecné principy vizulizace

Eduard Tufte

Klíčová postava moderního přístupu k vizualizaci informací.

Chartjunk; data : ink ratio; data density; micro - macro reading.

Obecné principy vizulizace

  1. Důraz na data
  2. Čitelnost
  3. Integrita

PRINCIP 1: Důraz na data

PRINCIP 1: Důraz na data

Méně je více. Grafy mají efektivně komunikovat informace, design má tento cíl podpořit, ne zamlžit.

Převzato z Harford (2021)

Poměr DATA : INKOUST

Méně je více

Někdy se trochu inkoustu navíc vyplatí…

Nepoužívejte 3D grafy

Nejde jen o zbytečný efekt, ale aktivně škodí

Důraz na data: se na default

Excel koláčový graf

Financování dle zdroje, v tisících Kč

Financování dle zdroje, v tisících Kč

Excel koláčový graf - důraz

Financování dle zdroje, v tisících Kč

Financování dle zdroje, v tisících Kč

Excel sloupcový graf

PŘED

PO

Excel sloupcový graf časová řada

PŘED

PO

Excel spojnicový graf

PŘED

PO

Excel likertovská škála (diverging chart)

PŘED

PO

Excel likertovská škála - varianta (diverging chart)

PŘED

PO

PRINCIP 2: Čitelnost

PRINCIP 2: Čitelnost

Koláčové grafy se nehodí na provonávání

% university-educated in new EU members

Příklad zlepšení čitelnosti i důrazu

“Small multiples” zlepšují čitelnost časových řad

Pokud máte flexibilní nástroj, můžete být kreativní…

S tímhle opatrně…

Může být užitečné pro dvě kategorie.

Dobře zvládnutá datová hustota

PRINCIP 3: Integrita

PRINCIP 3: Integrita

Vy rozhodujete o tom, jaké sdělení vizualizace vynese do popředí. Tím ale také nesete odpovědnost za možná zkreslení či přímo manipulace.

Jak moc že to rostou ceny bytů?

Problém osy y

axis y in -20 mil. (top), in 0 (bottom)axis y in -20 mil. (top), in 0 (bottom)

axis y in -20 mil. (top), in 0 (bottom)

Někdy je osa y arbitrární

Někdy je potřeba “zazoomovat”

Pokud osa y nezačíná na 0 …

Trápí nás chudoba nejméně ze všech evropských zemí?

Vizualizace míry nejistoty

Zde data z července 2021.

Nejistotu lze vizualizovat i u odhadů modelu

Pravdivá vizualizace, ale…

Obecné principy vizualizace - shrnutí

Důraz na data

  • Defaultní nastavení je často potřeba změnit
  • Ponechte jen ty prvky grafu, které mají informační hodnotu
  • Nepoužívejte 3D grafy
  • Přemýšlejte o tom, co chcete grafem říct

Čitelnost

  • Respektujte lidskou kognici
  • Vodorovné popisky grafu jsou lepší než svislé
  • Přemýšlejte o tom, v jakém kontextu se s grafem čtenář setká
  • Inspirujte se kreativními přístupy

Integrita

  • Opatrně s osou y
  • Komunikujte význam toho, co vizualizujete
  • Zohledněte míru nejistoty

Architektura vizualizace (grammar of graphics)

Leland Wilkinson an ‘The Grammar of Graphics’ (book)

Co dělá dobrou vizualizaci? Jednotlivé komponenty…

  1. Data
  2. Proměnné
  3. Algebra
  4. Měřítko
  5. Geometrie (line chart, bar chart, …)
  6. “Estetika” (barvy, tvary, sytost, …)

Hadley Wickham a překlopení Wilkinsonových myšlenek do softwaru

ggplot2

Sedm vrstev grafu. Tři povinné:

  1. Data

  2. Estetika - mapování informací na barvu, tvar, sytost, …

  3. Geometrie - grafické elementy, které reprezentují data

Čtyři “navíc”:

  1. Facety (small multiples)

  2. Agregované statistiky (např. regresní křivka)

  3. Úprava souřadnic (např. logaritmické měřítko)

  4. Téma (theme) - design grafu

Data

## # A tibble: 6 x 8
##   species island bill_length_mm bill_depth_mm flipper_length_~ body_mass_g sex  
##   <fct>   <fct>           <dbl>         <dbl>            <int>       <int> <fct>
## 1 Adelie  Torge~           39.1          18.7              181        3750 male 
## 2 Adelie  Torge~           39.5          17.4              186        3800 fema~
## 3 Adelie  Torge~           40.3          18                195        3250 fema~
## 4 Adelie  Torge~           NA            NA                 NA          NA <NA> 
## 5 Adelie  Torge~           36.7          19.3              193        3450 fema~
## 6 Adelie  Torge~           39.3          20.6              190        3650 male 
## # ... with 1 more variable: year <int>
ggplot(data = penguins)

Estetika (Aesthetics)

  • osy
  • obrys
  • výplň
  • velikost
  • průhlednost
  • tvar

ggplot(data = penguins, 
       aes(x = sex))

Geometrie

  • křivky
  • body
  • sloupce
  • histogram
  • boxplot

ggplot(data = penguins, 
       aes(x = sex)) + 
  geom_bar()

Geometrie 2

  • křivky
  • body
  • sloupce
  • histogram
  • boxplot

ggplot(data = penguins %>% 
         filter(!is.na(sex)), 
       aes(x = sex,
           y = bill_length_mm)) + 
  geom_boxplot() +
  theme_classic()

Galerie 1

Galerie 2

Galerie 3

Galerie 4

Galerie 5

Poděkování

Tato prezentace přirozeně čerpá z těžko představitelného objemu práce těžko představitelného množství lidí.

Přesto bych speciálně rád poděkoval Petrovi Bouchalovi. S ním jsme v roce 2016 připravovali kurz o metodologii vědy na letní akademii pro středoškoláky Discover, kde jsme se vizualizaci hodně věnovali. Petr také hostoval v mých kurzech na FF UK a teprve při jeho předndáškách jsem plně docenil hodnotu toho, když vizualizaci začneme vnímat jako plnohodnotnou pomocnou vědeckou disciplínu. S řadou příkladů v této prezentaci jsem se seznámil díky Petrovi.

Zdroje - principy a aplikace

Zdroje - ggplot2

Odkazovaná literatura a další zdroje

Pokud zdroje odkazované v prezentaci nejsou interaktivní (neobahují rozklik přímo na své umístění), najdete je v seznamu zde:

Harford, Tim. 2021. How to Make the World Add up: Ten Rules for Thinking Differently about Numbers. 1st edition. London: The Bridge Street Press.

Medina, John. 2014. Brain Rules (Updated and Expanded): 12 Principles for Surviving and Thriving at Work, Home, and School. Second edition. Seattle, WA: Pear Press.

Ware, Colin. 2012. Information Visualization: Perception for Design. 3rd edition. Waltham, MA: Morgan Kaufmann.